MODELAGEM E PREVISÃO DO NÚMERO DE CASOS DE INTERNAÇÃO POR DOENÇAS DO APARELHO RESPIRATÓRIO NA CIDADE DE SÃO PAULO VIA LSTM

Introdução

  • Compreende-se que há uma estreita relação entre fatores climáticos e a saúde humana, especialmente no que se refere ao sistema respiratório.
  • Condições climáticas adversas podem aumentar a ocorrência de internações hospitalares e, em casos mais graves, levar a óbitos (Arbex 2012).

Introdução

  • Na saúde pública, prever o número de internações esperadas em um determinado período é essencial para criação de políticas públicas e previsão de cenários de maior exigência dos serviços de sáudes para atender pacientes com problemas respiratórios.
  • Neste trabalho, fizemos um modelo capaz de prever o número de internações, utilizando uma classe de redes neurais apropriada para séries temporais, isto é, o LSTM.
  • O estudo concentra-se na modelagem e previsão do número de internações por doenças do sistema respiratório na cidade de São Paulo entre os anos de 2018 e 2019.

Materiais e Métodos

Memória Longa de Curto Prazo (LSTM)

  • O LSTM é um tipo de rede neural da família de Redes Neurais Recorrentes (RNNs) que funcionam como uma espécie de diversos “mensageiros” que processam os dados que receberam, e transmitem isso para outros mensageiros.
  • Isso cria uma espécie de memória que é compartilhada entre eles e pode fornecer bons resultados como saídas.

Memória Longa de Curto Prazo (LSTM)

  • Devido a ineficiência das RNNs tradicionais não conseguirem manter as memórias por longos prazos surgiu o LSTM para superar esse problema (Bengio 1994).
  • Diferentemente de redes neurais recorrentes padrões, ele tem uma estrutura mais complexa.

Memória Longa de Curto Prazo (LSTM)

RNN Padrão. Fonte: https://colah.github.io/posts/2015-08-Understanding-LSTMs/

Memória Longa de Curto Prazo (LSTM)

Fonte: https://colah.github.io/posts/2015-08-Understanding-LSTMs/

Memória Longa de Curto Prazo (LSTM)

Fonte: https://colah.github.io/posts/2015-08-Understanding-LSTMs/

Memória Longa de Curto Prazo (LSTM)

Fonte: https://colah.github.io/posts/2015-08-Understanding-LSTMs/

\(f_t = \sigma(w_f[h_{t-1}, x_t] + \theta_f)\)

Memória Longa de Curto Prazo (LSTM)

Fonte: https://colah.github.io/posts/2015-08-Understanding-LSTMs/

\(\tilde{C_t} = tanh(w_C[h_{t-1},x_t] + \theta_C)\)

\(i_t = \sigma(w_i[h_{t-1},x_t] + \theta_i)\)

Memória Longa de Curto Prazo (LSTM)

Fonte: https://colah.github.io/posts/2015-08-Understanding-LSTMs/

\(C_t = f_tC_{t-1} + i_t\tilde{C_t}\)

Memória Longa de Curto Prazo (LSTM)

Fonte: https://colah.github.io/posts/2015-08-Understanding-LSTMs/

Memória Longa de Curto Prazo (LSTM)

  • Existem outras variações do LSTM;
  • Com propriedades diferentes que podem ser avaliadas.

Base de Dadoss

  • Variável Alvo: Número de Internações por Doenças do Aparelho Respiratório;
  • Covariáveis: Material Particulado Fino, Temperatura Média e Umidade Relativa do Ar Média;
  • Fontes: DATASUS e Sistema Integrado de Serviços Ambientais (SISAM);
  • Frequência: Diária;
  • Período: 01/01/2018 a 30/11/2019.
  • Local: São Paulo - SP

Resultados

Análise Descritiva

Análise Descritiva

Análise Descritiva

Análise Descritiva

Resultados

Resultados

Resultados

Modelo RMSE Rsquared MAE
Modelo Completo (lag = 3) 42,1282 0,0933 33,7120
Modelo s/ Umidade (lag = 3) 42,1282 0,0933 33,7120
Modelo s/Umidade (lag = 7) 55,9767 0,0079 42,6284
Modelo s/Umidade (lag = 1) 45,8886 0,0805 38,0505

Tabela: Métricas do modelo da base treino (Jan de 2018 a Ago de 2019).

Resultados

Resultados

Resultados

Resultados

Resultados

Modelo RMSE Rsquared MAE
Modelo Completo (lag = 3) 25,6221 0,3163 20,0272
Modelo s/ Umidade (lag = 3) 25,6221 0,3163 20,0272
Modelo s/Umidade (lag = 7) 23,0609 0,4388 18,2464
Modelo s/Umidade (lag = 1) 28,2284 0,2441 22,7946

Tabela: Métricas do modelo da base teste (Set-Out-Nov de 2019).

Conclusão

  • A umidade não alterou significativamente as estimativas e previsão do modelo, talvez devido ao seu comportamento problemático em 2018;
  • Mesmo com diversos modelos testados, foi difícil realizar uma boa previsão;
  • Pode-se, no futuro, explorar mais a ideia de \(lags\) e como eles impactam as variáveis do modelo e também avaliar o impacto de outras covariáveis como precipitação e outros poluentes.

Referências

Arbex, Marcos Abdo. 2012. “A Poluição Do Ar e o Sistema Respiratório.” Jornal Brasileiro de Pneumologia 38 (5): 643–55. https://doi.org/10.1590/s1806-37132012000500015.
Bengio, Y. 1994. “Learning Long-Term Dependencies with Gradient Descent Is Difficult.” IEEE Transactions on Neural Networks 5 (2): 157–66. https://doi.org/10.1109/72.279181.